package com.atguigu.bigdata.spark.rdd.instance;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;

import java.util.Arrays;
import java.util.List;

/**
 * @Author gmd
 * @Description 从内存中创建RDD模型
 * @Date 2024-05-26 16:19:54
 */
public class Spark02_RDD_Memory {

    public static void main(String[] args) {
        final SparkConf conf = new SparkConf();
        conf.setMaster("local");
        conf.setAppName("spark");
        final JavaSparkContext jsc = new JavaSparkContext(conf);

        // 构建RDD数据处理模型，利用环境对象对接内存数据源，构建RDD对象
        final List<String> names = Arrays.asList("zhangsan", "lisi", "wangwu");

        // parallelize（并行）方法可以传递参数：集合
        final JavaRDD<String> rdd = jsc.parallelize(names);

        // 收集rdd数据模型中的数据
        final List<String> collect = rdd.collect();
        // 遍历rdd数据模型中的数据
        collect.forEach(System.out::println);

        jsc.close();
    }

}
